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FRQCEDES ET D1SFOSIT8FS DE CODAGE ET DE DECODAGE AUDIO 

La presente invention concerne le domaine du codage des signaux 
audio. Elle s' applique en particulier, mais non exclusivement, au codage de la 
parole, en bande etroite ou en bande elargie, dans diverses gammes de d§bit 
5 de codage. 

La conception d'un codec audio vise principaiement a fournir un bon 
compromis entre le debit du flux transmis par le codeur et la.qualrte du'signal 
audio que le decodeur est capable de reconstmire a partir de ce flux. - 

Dans cette optique. il a notamment ete developpe des families de 

10 codeurs reposant sur une analyse du signal audio dans le domaine spectral : le 
codeur estime une frequence fondamentale du signal, representant sa hauteur 
tonale {« pitch »), et I'analyse spectrale consiste a determiner des parametres 
representant la structure harmonique du signal aux frequences qui soht des 
multiples entiers de cette frequence fondamentale. Une modelisatioh de la 

15 composante non-harmonique, ou non-voisee. peut egalement etre effectuee 
dans le domaine spectral. Les parametres transmis au decodeur representent 
typiquement le module du spectre des composantes voisees et non-voisees. II 
s'y ajoute des informations representant soit des decisions voise/non-voise 
relatives a differentes portions de spectre, soit des informations sur la 

20 probabilite de voisement du signal, permettant au decodeur de determiner dans 
queues portions du spectre il doit utiliser la composante voisee ou la 
composante non-voisee. 

Ces families de codeurs comprennent les codeurs du type MBE 
(« Multi-Band Excitation »), ou encore les codeurs de type STC (« Sinusoidal 

25 Transform Coder »). A titre de reference, on peut citer les brevets US 

4 856 068. 4 885 790, 4 937 873, 5 054 072. 5 081 681, 5 195 166, 5 216 747. 

5 226 084, 5 226 108, 5 247 579. 5 473 727. 5 517 511. 5 630 Oil. 5 630 012, 
5 649 050, 5 651 093. 5 664 051 . 5 664 052. 5 684 926. 5 701 390. 5 715 365. 
5 749 065. 5 752 222. 5 765 127. 5 774 837 et 5 890 108. 

30 Un but de la presente invention est de permettre, dans un schema de 

codage a analyse dans le domaine spectral, d'ameliorer la modelisation des 
phases du spectre du signal par le decodeur. 

L' invention propose ainsi un precede de codage d'un signal audio, 
dans lequel on estime une frequence fondamentale du signal audio, on 

35 determine un spectre du signal audio par une transformee dans le domaine 



frequentiel d'une trame du signal audio, et on inclut dans un flux numerique de 
sortie des donnees de codage d'une composante harmonique du signal audio, 
comprenant des donnees representatives d'ampiitudes spectrales associees a 
des frequences multiples de la frequence fondamentale estimee. Selon 
I'invention, lesdites donnees representatives d'ampiitudes spectrales associees 
a des frequences multiples de la frequence fondamentale sont obtenues au 
moyen de coefficients cepstraux calcules en trans formant dans le domaine 
cepstral une enveloppe superieure comprimee du spectre du signal audio, et 
les donnees de codage de la composante harmonique comprennent en outre, 
pour au moins une des frequences multiples de la frequence fondamentale 
estimee, des donnees relatives a la phase du spectre du signal audio au 
voisinage de ladite frequence multiple. 

Un autre aspect de la presente invention se rapporte a un precede de 
decodage d'un flux numerique d'entree representant un signal audio code, 
dans lequel on regoit dans le flux numerique d'entree des donnees de codage 
d'une frequence fondamentale du signal audio et des donnees de codage 
d'une composante harmonique comprenant des donnees de quantification de 
coefficients cepstraux representant une enveloppe spectrale superieure du 
signal audio, et on genere une estimation spectrale de la composante 
harmonique dont le module est determine par ladite enveloppe spectrale 
superieure aux frequences multiples de la frequence fondamentale. Selon 
I'invention, pour determiner la phase de I'estimation spectrale de la 
composante harmonique, on transforme les coefficients cepstraux par liftrage 
et lissage dans le domaine cepstral, et on calcule des phases minimales du 
signal audio a des frequences multiples de la frequence fondamentale sur la 
base des coefficients cepstraux transform§s. Selon I'invention, on peut 
egalement determiner une variation de la phase de I'estimation spectrale de la 
composante harmonique sur au moins un intervalle de frequences entourant 
une frequence multiple de la frequence fondamentale sur la base de 
parametres de quantification inclus dans les donnees de codage de la 
composante harmonique. 

I'invention propose egalement un codeur et un decodeur audio 
comprenant des moyens pour la mise en oeuvre des precedes ci-dessus. 

D'autres particularites et avantages de la presente invention 
apparaitront dans la description ci-apres d'exemples de realisation non 
limitatifs, en reference aux dessins annexes, dans lesquels : 
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- la figure 1 est un schema synoptique d'un codeur audio selon I' invention ; 

- les figures 2 et 3 sont des diagrammes illustrant la formation des trames 
de signal audio dans le codeur de la figure 1 ; 

- les figures 4 et 5 sont des graphiques montrant un exemple de spectre 
5 du signal audio et illustrant I' extraction des enveloppes superieure et 

inferieure de ce spectre ; 

- la figure 6 est un schema synoptique d'un exemple de moyens de 

quantification utilisables dans le codeur de la figure 1 ; 

- la figure 7 est un schema synoptique de moyens utilisables pour extraire 
10 des parametres se rapportant a la phase de la composante non- 

harmonique dans une variante du codeur de la figure 1 ; 

- la figure 8 est un schema synoptique d'un decodeur audio correspondant 
au codeur de la figure 1 ; 

- la figure 9 est un organigramme d'un exemple de procedure de lissage 
15 de coefficients spectraux et d'extraction de phases minimales mise en 

oeuvre dans le decodeur de la figure 8 ; 

- la figure 10 est un schema synoptique de modules d' analyse et de 
mixage spectral de composantes harmonique et non-harmonique du 
signal audio ; 

20 - les figures 11 a 13 sont des graphiques montrant des exemples de 

fonctions non-lineaires utilisables dans le module d' analyse de la figure 
10; 

- les figures 14 et 15 sont des diagrammes illustrant une fa9on de proceder 
a la synthese temporelle des trames de signal dans le decodeur de la 

25 figure 8 ; 

- les figures 16 et 17 sont des graphiques montrant des fonctions de 
fenetrage utilisables dans la synthese des trames suivant les figures 14 
et15; 

- les figures 18 et 19 sont des schemas synoptiques de moyens 
30 d' interpolation utilisables dans une variante de realisation du codeur et du 

decodeur ; 

- la figure 20 est un schema synoptique de moyens d' interpolation 
utilisables dans une autre variante de realisation du codeur ; 

- les figures 21 et 22 sont des diagrammes illustrant une autre fa?on de 
35 proceder a la synthese temporelle des trames de signal dans le decodeur 

de la figure 8, a I'aide d'une interpolation de parametres ; 
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- les figures 23 a 25 sont des schemas synoptiques de variantes de 
moyens de post-traitement des coefficients cepstraux representant 
I'enveloppe superieure du spectre du signal dans le codeur de la figure 
1;et 

5 - la figure 26 est un schema synoptique partiel d'un decodeur associe a un 

codeur selon la figure 25. 

Le codeur e t le decodeur decrits ci-apres sont des circuits numeriques 

qui peuvent, comme il est usuel dans le domaine du traitement des signaux 
audio, etre realises par programmation d'un processeur de signal numerique 
10 (DSP) ou d'un circuit integre d'application specifique (ASIC). 

Le codeur audio represents sur la figure 1 traits un signal audio 
d'entree x qui, dans Texemple non-limitatif considers ci-apres, est un signal de 
parole. Le signal x est disponible sous forme numerique, par example a une 
frequence d'echantillonnage Fg de 8 kHz. II est par exemple delivre par un 
15 convertisseur analogique-numerique traitant le signal de sortie amplifie d'un 
microphone. Le signal d'entree x peut egalement etre forme a partir d'une autre 
version, analogique ou numerique, codee ou non, du signal de parole. 

Le codeur comprend un module 1 qui forme des frames successives 
de signal audio pour les differents traitements effectues, et un multiplexeur de 
20 sortie 6 qui delivre un flux de sortie O contenant pour chaque frame des jeux 
de parametres de quantification a partir desquels un decodeur sera capable de 
synthetiser une version decodee du signal audio. 

La structure des trames est illustree par les figures 2 et 3. Chaque 
frame 2 est composee d'un nombre N d'echantillons consecutifs du signal 
25 audio x. Les trames successives presentent des decalages temporels mutuels 
correspondant a M echantillons, de sorte que leur recouvrement est de 
L = N-M echantillons du signal. Dans I' exemple considere, ou N = 256, 
M = 160 et L = 96, la duree des trames 2 est de N/Fg = 32 ms, et une frame est 
formee toutes les M/Fg = 20 ms. 

30 De fa?on classique, le module 1 multiplie les echantillons de chaque 

frame 2 par une fonction de fenetrage f^. de preference choisie pour ses 
bonnes proprietes spectrales. Les echantillons x(i) de la trame etant numerotes 
de i = 0 a i = N-1, la fenetre d' analyse f^{i) peut ainsi etre une fenetre de 
Hamming, d'expression : 
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f^(i) = 0.54 + 0.46.cos[^27i '"^^~"'^^^ j (1) 
ou une fenetre de Manning d' expression : 



(2) 



ou encore une fenetre de Kaiser, d' expression 




ou a est un coefficient par exemple egal a 6. et Iq(.) designe la fonction de 
Bes.sel tf indice 0. 

Le codeur de la figure 1 precede a une analyse du signal audio dans le 
domaine spectral. II comporte un module 3 qui calcule la transformee de 

10 Fourier rapide (TFR) de chaque trame de signal. La trame de signal est mise 
en forme avant d'etre soumise au module de TFR 3 : le module 1 lui adjoint 
N = 256 echantillons a zero afin d'obtenir la resolution maximale de la 
transformee de Fourier, et il effectue d' autre part une permutation circulaire des 
2N = 512 echantillons afin de compenser les effets de phase resultant de la 

-15 fenetre d'analyse. Cette modification de la trame est illustree par la figure 3. La 
trame dont on calcule la transformee de Fourier rapide sur 2N = 512 points 
commence par les N/2 = 128 derniers echantillons ponderes de la trame, suivis 
par les N = 256 echantillons a zero, et se termine par les N/2 = 128 premiers 
echantillons ponderes de la trame. 

20 Le module de TFR 3 obtient le spectre du signal pour chaque trame, 

dont le module et la phase sont respectivement notes |X| et cpx, ou |X(i)| et 
(Px(i) pour les index de frequence i = 0 a i = 2N-1 (grace a la symetrie de la 
transformee de Fourier et des trames. on peut se limiter aux valeurs pour 
0<i < N). 

25 Un detecteur de frequence fondamentale 4 estime pour chaque trame 

de signal une valeur de la frequence fondamentale Fq. Le detecteur 4 peut 
appliquertoute methode connue tf analyse du signal de parole de la trame pour 
estimer la frequence fondamentale Fg. par exemple une methode basee sur la 

fonction d' autocorrelation ou la fonction AMDF, eventuellement precedee d'un 
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module de blanchiment par prediction lineaire. L'estimation peut egalement 
etre effectuee dans le domaine spectral ou dans le domaine cepstral. Une 
autre possibiiite est d'evaiuer les intervalles de temps entre les ruptures 
consecutives du signal de parole attribuables a des fermetures de la glotte du 
5 locuteur intervenant pendant la duree de la trame. Des methodes bien connues 
utilisables pour detecter de telles micro-ruptures sont decrites dans les articles 
suivants : M. Basseville et al.. « Sequential detec tion of abrupt changes in 
spectral characteristics of digital signals » (IEEE Trans, on information Theory. 
1983. Vol. IT-29, n" 5, pages 708-723) ; R. Andre-Obrecht. « A new statistical 

10 approach for the automatic segmentation of continuous speech signals » (IEEE 
Trans, on Acous., Speech and Sig. Proc, Vol.36, N'l, janvier 1988); et 
C. MURGIA et al., « An algorithm for the estimation of glottal closure instants 
using the sequential detection of abrupt changes in speech signals » (Signal 
Processing VII, 1994, pages 1685-1688). 

15 La frequence fondamentale estimee Fq fait I'objet d'une quantification, 

par exemple scalaire, par un module 5. qui foumit au multiplexeur de sortie 6 
un index iF de quantification de la frequence fondamentale pour cheque trame 
du signal. 

Le codeur utilise des modelisations parametriques cepstrales pour 
20 representer une enveloppe superieure et une enveloppe inferieure du spectre 
du signal audio. La premiere etape de la transformation cepstrale consiste a 
appliquer au module du spectre du signal une fonction de compression 
spectrale, qui peut etre une fonction logarithmique ou en racine. Le module 8 
du codeur opere ainsi, pour chaque vaieur X(i) du spectre du signal (0 ^ i < N), 
25 la transformation suivante : 

LX(i) = Log(|x(i)|) (4) 
dans le cas d'une compression logarithmique ou 

l-X(i) = |X(i)|^ (5) 

dans le cas d'une compression en racine, y etant un exposant compris entre 0 
30 eti. 

Le spectre comprime LX du signal audio est traite par un module 9 qui 
extrait des amplitudes spectrales associees aux harmoniques du signal 
con-espondant aux multiples de la frequence fondamentale estimee FO. Ces 
amplitudes sont ensuite interpolees par un module 10 afin d'obtenir une 




enveloppe superieure comprimee notee LX_sup. 

II est a noter que la compression spectrale pourrait de fapon 
equivalente etre effectuee apres la determination des amplitudes associees 
aux harmoniques. Elle pourrait egalement etre effectuee apres T interpolation, 

5 ce qui ne ferait que modifier la forme des fonctions d' interpolation. 

Le module 9 d'extraction des maxima tient compte de Teventuelle 
variation de la frequence fondamentale sur la trame d' analyse, des erreurs que 
peut commettre le detecteur 4. ainsi que des imprecisions iiees au caraaere 
discret de rechantillonnage en frequence. Pour cela, la recherche des 

10 amplitudes des pics spectraux ne consiste pas simplement a prendre les 
valeurs LX(i) correspondant aux index i tels que i.Fg/2N soit la frequence la 
plus proche d'une harmonique de frequence R.Fq (k > 1). L'amplitude spectrale 
retenue pour une harmonique d'ordre k est un maximum local du module du 
spectre au voisinage de la frequence k.pQ (cette amplitude est obtenue 

15 directement sous forme comprimee lorsque la compression spectrale 8 est 
effectuee avant r extraction des maxima 9). 

Les figures 4 et 5 montrent un exemple de forme du spectre comprime 
LX, ou on voit que les amplitudes maximales des pics harmoniques ne 
coincident pas necessairement avec les amplitudes correspondant. aux 

20 multiples entiers de la frequence fondamentale estimee Fq. Les flancs des pics 
etant assez raides, une petite erreur de positionnement de la frequence 
fondamentale Fq, amplifiee par I'indice d' harmonique k. peut distordre 
fortement 1' enveloppe superieure estimee du spectre et provoquer une 
mauvaise modeiisation de la structure formantique du signal. Par exemple, 

25 prendre directement ramplitude spectrale pour la frequence 3.Fq dans le cas 
des figures 4 et 5 produirait une erreur importante dans I'extractioh de 
I'enveloppe superieure au voisinage de Tharmonique d'ordre k = 3, alors qu'il 
s*agit d'une zone energetiquement importante dans Texemple dessine. En 
effectuant T interpolation a partir du veritable maximum, on evite ce genre 

30 d' erreur d'estimation de I'enveioppe superieure. 

Dans r exemple represente sur la figure 4, 1' interpolation est effectuee 
entre des points dont I'abscisse est la frequence correspondant au maximum 
de ramplitude d'un pic spectral, et dont Tordonnee est ce maximum, avant ou 
apres compression. 
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La distorsion non-lineaire permet de minimiser plus efficacement 
I'erreur de modelisation. Elle est par exemple effectuee selon une echelle de 
frequences de type Mel ou Bark. Cette distorsion peut eventuellement 
dependre de la frequence fondamentale estimee Fq. La figure 1 illustre le cas 
de I' echelle Mel. La relation entre les frequences F du spectre lineaire, 
exprimees en hertz, et les frequences F' de I' echelle Mel est la suivante : 
^. 1000 . f ^ 



logio(2) '""I 1000 
Afin de limiter le debit de transmission, une troncature des coefficients 
cepstraux cx_sup est effectuee. Le module de TFRI 13 a besoin de calculer 
10 seulement un vecteur cepstral de NCS coefficients, cepstraux d'ordres 0 a 
NCS-1. A titre d' exemple, NCS peut etre egal a 16. 

Un post-filtrage dans le domaine cepstral, appele post-liftrage, est 
applique par un module 15 a I'enveloppe superieure comprimee LX_sup. Ce 
post-liftrage correspond a une manipulation des coefficients cepstraux cx_sup 
15 delivres par le module de TRF1 13, qui correspond approximativement a un 
post-filtrage de la partie harmonique du signal par une fonction de transfert 
ayant la forme ciassique : 

OU A(2) est la fonction de transfert d'un filtre de prediction lineaire du signal 
20 audio. Yi 72 sont des coefficients compris entre 0 et 1 . et est un coefficient 
de preaccentuation eventuellement nuL La relation entre le coefficient post-liftre 
d'ordre i. note Cp(i), et le coefficient cepstral correspondant c(i) = cx_sup(i) 

delivre par le module 13 est alors : 

Cp(O) = c(0) 

(8) 



(i) = (l + - y!, )c(i) - ^ pour i > 0 



25 Le coefficient de preaccentuation optionnel |i peut etre controle en 

posant comme contrainte de preserver la valeur du coefficient cepstral 
cx_sup(1) relatif a la pente. En effet, la valeur c(1) = cx_sup(1) d'un bruit blanc 
filtre par le filtre de preaccentuation correspond au coefficient de 
preaccentuation. On peut ainsi choisir ce dernier de la fagon suivante : 

30 ^= (Y2-^i)-c('')- 

Apres le post-liftre 15, un module de normalisation 16 modifie encore 



- 10- 

les coefficients cepstraux en Imposant la contrainte de modelisation exacts 
d'un point du spectre initial, qui est de preference le point le plus energetique 
parmi les maxima spectraux extraits par le module 9. En pratique, cette 
normalisation modifie seulement la valeur du coefficient Cp(0). 

Le module de normalisation 16 fonctionne de la fa^on suivante: il 
recalcule une valeur du spectre synthetise a la frequence du maximum Indique 
par le module 9, par transformee de Fourier des coe fficients cepstraux 
tronques et post-liftres, en tenant compte de la distorsion non-lineaire de I'axe 
des frequences ; il determine un gain de normalisation g^^ par la difference 
logarithmique entre la valeur du maximum fournie par le module 9 et cette 
valeur recalculee ; et il ajoute le gain g,g au coefficient cepstral post-liftre Cp{0). 

Cette normalisation peut etre vue comme faisant partie du post-liftrage. 

Les coefficients cepstraux post-liftres et normalises font I'objet d'une 
quantification par un module 18 qui transmet des index de quantification 
correspondants icxs au multiplexeur de sortie 6 du codeur. 

Le module 18 peut fonctionner par quantification vectorielle a partir de 
vecteurs cepstraux formes de coefficients post-liftres et normalises, notes ici 
cx[n] pour la frame de signal de rang n. A titre d'exemple, le vecteur cepstral 

cx[n] de NCS = 16 coefficients cepstraux cx[n.O], cx[n,1] cx[n,NCS-1] est 

distribue en quatre sous-vecteurs cepstraux contenant chacun quatre 
coefficients d*ordres consecutifs. Le vecteur cepstral cx[n] peut etre traite par 
les moyens representes sur la figure 6. faisant partie du module de 
quantification 18. Ces moyens mettent en oeuvre, pour chaque composante 
cx[n,i], un predicteur de la forme : 

cxp[n. i] = (l - a(i)). rcx[n, i] + a(l). rcx[n-1. i] (9) 
ou rcx[n] designe un vecteur residuel de prediction pour la frame de rang n 

dont les composantes sont respectivement notees rcx[n,0]. rcx[n,1] 

rcx[n,NCS-1], et a(i) designe un coefficient de prediction choisi pour etre 
representatif cTune correlation inter-trame supposee. Apres quantification des 
residus, ce vecteur residuel est defini par : 

rcx[n.i]="^^^-'^-^(')-^^^-qtn-1.il ..g. 
2-a(i) 

Oil rcx_q[n-1] designe le vecteur residuel quantifie pour la frame de rang n-1. 
dont les composantes sont respectivement notees rcx_q[n,0], rcx_q[n,1] 
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rcx_q[n.NCS-1]. 

Le numerateur de la relation (10) est obtenu par un soustracteur 20, 
dont les composantes du vecteur de sortie sont divisees par les quantites 
2-a(\) en 21. Aux fins de la quantification, le vecteur residue! rcx[n] est 

5 subdivise en quatre sous-vecteurs, correspondant a la subdivision en quatre 
sous-vecteurs cepstraux. Sur la base rfun dictionnaire obtenu par 
apprentissage prealable, I'unite 22 precede a la quantification vectorielle de 
cheque sous-vecteur du vecteur residue! rcx[n]. Cette quantification peut 
consister, pour chaque sous-vecteur srcx[n], a selectionner dans le dictionnaire 

10 le sous-vecteur quantifie srcx_q[n] qui minimise Terreur quadratique 

||srcx[n]-srcx_q[n]|^. Uensemble icxs des index de quantification icx. 

correspondant aux adresses dans le ou les dictionnaires des sous-vecteurs 
residuels quantifies srcx_q[n], est fourni au multiplexeur de sortie 6. 

Uunite 22 delivre egalement les valeurs des sous-vecteurs residuels 

15 quantifies, qui ferment le vecteur rcx_q[n]. Celui-ci est retarde dune trame en 
23, et ses composantes sont multipliees par les coefficients a(i) en 24 pour 
fournir le vecteur a T entree negative du soustracteur 20. Ce dernier vecteur est 
d' autre part fourni a un additionneur 25. dont 1' autre entree re?oit un vecteur 
forme par les composantes du residu quantifie rcx_q[n] respectivement 

20 multipliees par les quantites 1-a(i) en 26, L'additionneur 25 delivre ainsi le 
vecteur cepstral quantifie cx_q[n] que recuperera le decodeur. 

Le coefficient de prediction a(i) peut etre optimise separement pour 
chacun des coefficients cepstraux. Les dictionnaires de quantification peuvent 
aussi etre optimises separement pour chacun quatre sous-vecteurs cepstraux. 

25 D'autre part, il est possible, de fagon connue en soi, de normaliser les vecteurs 
cepstraux avant d'appliquer le schema de prediction/quantification, a partir de 
la variance des cepstres. 

II est a noter que le schema ci-dessus de quantification des coefficients 
cepstraux peut n*etre applique que pour certaines seulement des trames. Par 

30 exemple. on peut prevoir un second mode de quantification ainsi qu'un 
processus de selection de celui des deux modes qui minimise un critere de 
moindres carres avec les coefficients cepstraux a quantifier, et transmettre 
avec les index de quantification de la trame un bit indiquant lequel des deux 
' modes a ete selectionne. 

35 Les coefficients cepstraux quantifies cx_sup_q = cx_q[n] fournis par 
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Tadditionneur 25 sont adresses a un module 28 qui recalcule les amplitudes 
spectrales associees a une ou plusieurs des harmoniques de la frequence 
fondamentale Fq (figure 1). Ces amplitudes spectrales sont par exemple 
calculees sous forme comprimee. en appliquant la transformee de Fourier aux 
coefficients cepstraux quantifies en tenant compte de la distorsion non-lineaire 
de I'echelle des frequences utilisee dans la transformation cepstrale. Les 
amplitudes ainsi recalculees sont fou mies a un module d' adaptation 29 qui les 
compare a des amplitudes de maxima determinees par le module d' extraction 
9. 

Le module d' adaptation 29 controle le post-liftre 15 de fagon a 
minimiser un ecart de module entre le spectre du signal audio et les valeurs de 
module correspondantes calculees en 28. Get ecart de module peut etre 
exprime par une somme de valeurs absolues de differences d'amplitudes, 
comprlmees ou non, correspondant a une ou plusieurs des frequences 
harmoniques. Cette somme peut etre ponderee en fonction des amplitudes 
spectrales associees a ces frequences. 

De fa9on optimale, I'ecart de module pris en compte dans ['adaptation 
du post-liftrage tiendrait compte de toutes les harmoniques du spectre. 
Cependant, afin de reduire la complexite de roptimlsation. le module 28 peut 
ne resynthetiser les amplitudes spectrales que pour une ou plusieurs 
frequences multiples de la frequence fondamentale Fq, selectionnees sur la 
base de I' importance du module du spectre en valeur absolue. Le module 
d'adaptation 29 peut par exemple considerer les trois pics spectraux les plus 
intenses dans le calcul de I'ecart de module a minimiser. 

Dans une autre realisation, le module d'adaptation 29 estime une 
courbe de masquage spectral du signal audio au moyen d'un modele 
psychoacoustique, et les frequences prises en compte dans le calcul de I'ecart 
de module a minimiser sont selectionnees sur la base de 1' importance du 
module du spectre relativement a la courbe de masquage (on peut par 
exemple prendre les trois frequences pour lesquelles le module du spectre 
depasse le plus de la courbe de masquage). Differentes methodes classiques 
sont utilisables pour calculer la courbe de masquage a partir du signal audio. 
On peut par exemple utiliser celle developpee par J.D. Johnston (« Transform 
Coding of Audio Signals Using Perceptual Noise Criteria ». IEEE Journal on 
Selected Area in Communications, Vol. 6, No. 2, fevrier 1988). 
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Pour realiser 1' adaptation du post-1 if trage. le module 29 peut utiliser un 
modele identification de filtre. Une methode plus simple consiste a predefinir 
un ensemble de jeux de parametres de post-liftrage, c'est-a-dire un ensemble 
de couples 7^,72 dans le cas d'un post-liftrage selon les relations (8), a 

5 effectuer les operations incombant aux modules 15, 16, 18 et 28 pour chacun 
de ces jeux de parametres, et a retenir celui des jeux de parametres qui 
conduit a Tocart do modulQ minimal pntrp Ip sppr.trR rlii .signal ftt iRfi valfiur.s 
recalculees. Les index de quantification fournis par le module 18 sont al.ors 
ceux qui se rapportent au meilleur jeu de parametres. 

10 Par un processus analogue a celui de r extraction des coefficients 

cx_sup representant I'enveloppe superieure comprimee LX_sup du spectre du 
signal,- le codeur determine des coefficients cx_inf representant une eriveloppe 
jnferieure comprimee LXJnf Un module 30 extrait du spectre comprime LX 
des amplitudes spectrales associees a des frequences situees dans des zones 

15 du spectre intermediaires par rapport aux frequences multiples de la frequence 
fondamentale estimee Fq. 

Dans rexemple illustre par les figures 4 et 5. chaque amplitude 
associee a une frequence situee dans une zone intermediaire entre deux 
harmoniques successives k.Fg et (k+1).FQ correspond simplement au module 

20 du spectre pour la frequence (k+1/2).Fo situee au milieu de I'intervalle separant 
les deux harmoniques. Dans une autre realisation, cette amplitude pourrait etre 
une moyenne du module du spectre sur une petite plage entourant cette 
frequence (k+1/2).Fo. 

Un module 31 precede a une interpolation, par exemple lineaire, des 

25 amplitudes spectrales associees aux frequences situees dans les zones 
intermediaires pour obtenir Tenveloppe inferieure comprimee LXJnf 

La transformation cepstrale appliquee a cette enveloppe inferieure 
comprimee LXJnf est effectuee suivant une echelle de frequences resultant 
d'une distorsion non-lineaire appliquee par un module 32. Le module de TFRI 

30 33 calcule un vecteur cepstral de NCI coefficients cepstraux cxjnf d'ordres 0 a 
NCI-1 representant Tenveloppe inferieure. NCI est un nombre qui peut etre 
sensiblement plus petit que NCS, par exemple NCI = 4. 

La transformation non-lineaire de Techelle des frequences pour la 
transformation cepstrale de I'enveloppe inferieure peut etre realisee vers une 

35 echelle plus fine aux hautes frequences qu'aux basses frequences, ce qui 
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permet avantageusement de bien modeliser les composantes non-voisees du 
signal aux hautes frequences. Toutefois. pour assurer une homogeneite de 
representation entre I'enveloppe superieure at Fenveloppe inferieure. on pourra 
preferer adopter dans le module 32 la meme echelle que dans le module 12 
(Mel dans I'exemple consldere). 

Les coefficients cepstraux cx_inf representant I'enveloppe Inferieure 

maniere que le module 18 de quantification des coefficients cepstraux 
representant I'enveloppe superieure comprimee. Dans le cas consid6r6. ou on 
se limite a NCI = 4 coefficients cepstraux pour I'enveloppe inferieure. le vecteur 
ainsi forme est soumis a une quantification vectorielle de residu de prediction, 
effectuee par des moyens identiques a ceux representes sur la figure 6 mais 
sans subdivision en sous-vecteurs. L'index de quantification icx = icxi 
determine par le quantificateur vectoriel 22 pour cheque trame relativement aux 
coefficients cxjnf est fourni au multiplexeur de sortie 6 du codeur. 

Le codeur represents sur la figure 1 ne comporte aucun dispositif 
particulier pour coder les phases du spectre aux harmoniques du signal audio. 

En revanche, il comporte des moyens 36-40 pour coder une 
information temporelie liee a la phase de la composante non-harmonique 
representee par I'enveloppe inferieure. 

Un module 36 de decompression spectrale et un module 37 de TFRI 
forment une estimation temporelie de la trame de la composante non- 
harmonique. Le module 36 applique une fonction de decompression reciproque 
de la fonction de compression appliquee par le module 8 (c'est-a-dire une 
exponentielle ou une fonction puissance l/y) a I'enveloppe inferieure 
comprimee LX_inf produite par le module d' interpolation 31. Ceci fournit le 
module de la trame estimee de la composante non-harmonique. dont la phase 
est prise egale a celle (p^ du spectre du signal X sur la trame. La transformee 
de Fourier inverse effectuee par le module 37 fournit la trame estimee de la 
composante non-harmonique. 

Le module 38 subdivise cette trame estimee de la composante non- 
harmonique en plusieurs segments temporels. La trame delivree par le module 
37 se composant de 2N = 512 echantillons ponderes comme illustre par la 
figure 3, le module 38 considere seulement les N/2 = 128 premiers echantillons 
et les N/2 = 128 derniers echantillons, et les subdivise par exemple en 
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huit segments de 32 echantillons consecutifs representant chacun 4 ms de 
signal. 

Pour chaque segment, le module 38 calcule Tenergie egale a la 
somme des carres des echantillons, et forme un vecteur E1 forme de 
5 huit composantes reelles positives egales aux huit energies calculees. La plus 
grande de ces huit energies, notee EM, est egalement determinee pour etre 

fournie. avec le vecteur E1. a un module de normalisation 39. Celui-ci divise 

chaque composante du vecteur El par EM, de sorte que le vecteur normalise 
Emix est forme de huit composantes comprises entre 0 et 1. Cest ce vecteur 

10 normalise Emix, ou vecteur de ponderation, qui est soumis a la quantification 
par le module 40. Celui-ci peut operer une quantification vectorielle avec un 
dictionnaire determine lors d'un apprentissage prealable. L' index de 
quantification iEm est fourni par le module 40 au multiplexeur de sortie 6 du 
codeur. 

15 La figure 7 montre une variante de realisation des moyens employes 

par le codeur de la figure 1 pour determiner le vecteur Emix de ponderation 
energetique de la trame de la composante non-harmonique. Las modules 36, 
37 de decompression spectrale et de TFRI fonctionnent comme ceux qui 
portent les memes references sur la figure 1. Un module de selection 42 est 

20 ajoute pour determiner la valeur du module du spectre soumis a la transformee 
de Fourier inverse 37. Sur la base de la frequence fondamentale estimee Fg, le 

module 42 identifie des regions harmoniques et des regions non-harmoniques 
du spectre du signal audio. Par exemple. une frequence sera consideree 
comme appartenant a une region harmonique si elle se trouve dans un 
25 intervalle de frequences centre sur une harmonique K.Fq et de largeur 

correspondant a une largeur de raie spectrale synthetisee, et a une region non- 
harmonique sinon. Dans les regions non-harmoniques, le signal complexe 
soumis a la TFRI 37 est egal a la valeur du spectre, c'est-a-dire que son 
module et sa phase correspondent aux valeurs |X| et cp^ fournies par le module 

30 de TFR 3. Dans les regions harmoniques, ce signal complexe a la meme 
phase (p^ que le spectre et un module donne par Tenveloppe inferieure apres 

decompression spectrale 36. Cette fagon de proceder selon la figure 7 procure 
une modelisation plus precise des regions non-harmoniques. 

Le decodeur represents sur la figure 8 comprend un demultiplexeur 
35 tf entree 45 qui extrait du flux binaire a>, issu d'un codeur selon la figure 1. les 
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index iF. icxs, icxi, iEm de quantification de la frequence fondamentale Fq, des 
coefficients cepstraux representant i'enveloppe superieure comprimee. des 
coefficients representants I'enveloppe inferieure comprimee, et du vecteur de 
ponderation Emix, et les distribue respectivement a des modules 46. 47. 48 et 
5 49. Ces modules 46-49 comportent des dictionnaires de quantification 
semblables a ceux des modules 5, 18. 34 et 40 de la figure 1. afin de restituer 

dictionnaires pour former les residus de prediction quantifies rcx_q[n]. et lis en 
deduisent les vecteurs cepstraux quantifies cx_q[n] avec des elements 
10 identiques aux elements 23-26 de la figure 6. Ces vecteurs cepstraux 
quantifies cx_q[n] fournissent les coefficients cepstraux cx_sup_q et cx_inf_q 
traites par le decodeur. 

Un module 51 calcule la transformee de Fourier rapide des coefficients 
cepstraux cx_sup pour chaque trame de signal. L'echelle des frequences du 
spectre comprime qui en resulte est mcdifiee non-lineairement par un module 
52 appliquant la transformation non-lineaire reciproque de celle du module 12 
de la figure 1. et qui fournit I' estimation LX_sup de I'enveloppe superieure 
comprimee. Une decompression spectrale de LX_sup. operee par un module 
53, fournit I'enveloppe superieure X_sup comportant les valeurs estimees du 
module du spectre aux frequences multiples de la frequence fondamentale Fq. 
Le module 54 synthetise {'estimation spectrale de la composante 
harmonique du signal audio, par une somme de raies spectrales centrees sur 
les frequences multiples de la frequence fondamentale Fq et dont les 
amplitudes (en module) sont celles donnees par I'enveloppe superieure X_sup. 
25 Bien que le flux numerique d' entree cD ne comporte pas d' informations 

specifiques sur la phase du spectre du signal aux harmoniques de la frequence 
fondamentale, le decodeur de la figure 8 est capable d'extraire de 1' information 
sur cette phase a partir des coefficients cepstraux cx_sup_q representant 
I'enveloppe superieure comprimee. Cette information de phase est utilisee pour 
30 affecter une phase (p(k) a chacune des raies spectrales determinees par le 
module 54 dans I' estimation de la composante harmonique du signal. 

En premiere approximation, le signal de parole peut etre considere 
comme etant a phase minimale. D'autre part, il est connu que I'information de 
phase minimale peut se deduire facilement d'une modelisation cepstrale. Cette 
35 information de phase minimale est done calculee pour chaque frequence 
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harmonique. L'hypothese de phase minimale signifie que Tenergie du signal 
synthetise est localisee au debut de chaque periode de la frequence 
fondamentale Fg. 

Pour etre plus proche d'un signal de parole reel, on introduit un peu de 
5 dispersion au moyen d'un post-liftrage specifique des cepstres lors de la 
synthase de la phase. Avec ce post-liftrage, effectue par le module 55 de la 
figure 8, 11 est possible rfaccentuer les resonances formantiques de I'enveloppe 
et done de controler la dispersion des phases. Ce post-liftrage est par exemple 
de la forme (8). 

10 Pour limiter les ruptures de phase, il est preferable de lisser les 

coefficients cepstraux post-liftres, ce qui est effectue par le module 56. Le 
module 57 deduit des coefficients cepstraux post-liftres et lisses la phase 
minimale affectee a chaque raie spectrale representant un pic harmonique du 
spectre. 

15 Les operations effectuees par les modules 56, 57 de lissage et 

d'extraction de la phase minimale sont illustrees par I'organigramme de la 
figure 9. Le module 56 examine les variations des coefficients cepstraux pour 
appliquer un lissage moins important en presence de variations brusques qu'en 
presence de variations lentes. Pour cela, il effectue le lissage des coefficients 

20 cepstraux au moyen d'un facteur d'oubli choisi en fonction tfune 

comparaison entre un seuil d^^ et une distance d entre deux jeux successifs de 

coefficients cepstraux post-liftres. Le seuil d^^^ est lui-meme adapte en fonction 

des variations des coefficients cepstraux. 

La premiere etape 60 consiste a calculer la distance d entre les deux 

25 vecteurs successifs relatifs aux trames n-1 et n. Ces vecteurs, notes ici 
cxp[n-1] et cxp[n], correspondent pour chaque frame a I'ensemble des NCS 
coefficients cepstraux post-liftres representant Tenveloppe superieure 
comprimee. La distance utilisee peut notamment etre la distance euclidienne 
entre les deux vecteurs ou encore une distance quadratique. 

30 Deux lissages sont d'abord effectues, respectivement au moyen de 

facteurs d'oubli X^^^ et X^^^, pour determiner une distance minimale d^j^ et 
une distance maximale d^gx* ^th ensuite determine a Tetape 70 

comme etant situe entre les distances minimale et maximale dj^j,,, d^gx • 
^th = P-^max (^^P)-^min' '® coefficient p etant par exemple egal a 0.5. 
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Dans I'exemple represente. les facteurs tfoubli X^^^ et X^^^ sont eux- 

memes selectionnes parmi deux valeurs distinctes. respectivement X ■ X 

'■mini' '^min2 

^maxi. ^max2 comprises entre 0 et 1, les indices x^^^^ etant chacun 

sensiblement plus pres de 0 que les indices X^,^^- ^max2- Si d > d^j„ (test 61). 
le facteur d'oubli X^,^ est egal a X^^^, (etape 62) ; sinon il est pris egal a X^,^^ 

^min-dmin + C-^min) ^- Si d > d^^gx (test 65), le facteur d'oubli ^l^^^ est egal a 
^maxl (etape 66) ; sinon il est pris egal a X^^ (etape 67). A I'etape 68. la 
distance minimale d^^^ est prise egale a X^^.d^^^ + (1-W) d- 

. Si la distance d entre les deux vecteurs cepstraux consecutifs est plus 
grande que le seuil d^j, (test 71). on adopte pour le facteur d'oubli X^ une valeur 
relativement proche de 0 (etape 72). On considere dans ce cas que le 
signal correspondant est de type non stationnaire. de sorte qu'il n'y a pas lieu 
de conserver une grande memoire des coefficients cepstraux anterieurs. Si 
d ^ dth. on adopte a I'etape 73 pour le facteur d'oubli une valeur moins 
proche de 0 afin de lisser davantage les coefficients cepstraux. Le lissage est 
effectue a I'etape 74. ou le vecteur cxl[n] de coefficients lisses pour la trame 
courante n est detennine par : 

cxl[n] = Xc .cxl[n-1] + (1 - )cxp[n] (i i ) 

Le module 57 calcule ensuite les phases minimales (p(k) associees aux 
harmoniques kPg. De fa?on connue. la phase minimale pour une harmonique 
d'ordre k est donnee par : 

NCS-1 

(p(k) = -2. 2] cxl[n.m].sin(27cmkFo/Fe) (12) 
m=1 

ou cxl[n,m] designe le coefficient cepstral lisse d'ordre m pour la trame n. 

A I'etape 75, I'index d'harmonique k est initialise a 1. Pour initialiser le 
calcul de la phase minimale affectee a I'harmonique k. la phase (p(k) et I'index 
cepstral m sont initialises respectivement a 0 et 1 a I'etape 76. A I'etape 77. le 
module 57 ajoute a la phase <p(k) la quantite -2.cxl[n.m].sin(27imk.Fo/F,). 
L'index cepstral m est incremente a I'etape 78 et compare a NCS a I'etape 79. 
Les etapes 77 et 78 sont repetees tant que m < NCS. Quand m = NCS. le 
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calcul de la phase minimale est termine pour rharmonique k. et T index k est 
incremente a Tetape 80. Le calcul de phases minimales 76-79 est renouvele 
pour rharmonique suivante tant que k.pQ < Fg/2 (test 81). 

Dans I'exemple de realisation selon la figure 8, le module 54 tient 
5 compte d'une phase constante sur la largeur de chaque raie spectrale, egale a 
la phase minimale cp(k) fournie pour rharmonique correspondante k par le 
mnrii iIp f\l 

U estimation de la composante harmonique est synthetisee par 

sommation de raies spectrales positionnees aux frequences harmoniques de la 
10 frequence fondamentale Fq- Lors de cette synthese, on peut positioriner les 

raies spectrales sur Taxe des frequences avec une resolution superieure a la 
resolution de la transformee de Fourier. Pour cela, on precalcule une fois pour 
toutes une raie spectrale de reference selon la resolution superieure. Ce calcul 

peut consister en une transformee de Fourier de la fenetre d' analyse fA avec 

15 une taille de transformee de 16384 points, procurant une resolution de 0,5 Hz 
par point. La synthese de chaque raie harmonique est alors effectuee par le 
module 54 en positionnant sur I'axe des frequences la raie de reference a 
haute resolution, et en sous-echantillonnant cette raie spectrale de reference 
pour se ramener a la resolution de 16,625 Hz de la transformee de Fourier sur 

20 512 points, Ceci permet de positionner avec precision la raie spectrale. 

Pour la determination de Tenveloppe inferieure, le module de TFR 85 
du decodeur de la figure 8 regoit les NCI coefficients cepstraux quantifies 
cxjnf^q d'ordres 0 a NCI-1, et il les complete avantageusement par les 
NCS - NCI coefficients cepstraux cx_sup_q d'ordre NCI a NCS - 1 

25 representant I'enveloppe superieure. En effet. on peut estimer en premiere 
approximation que les variations rapides de I'enveloppe inferieure comprimee 
sent bien reproduites par celles de Tenveloppe superieure comprimee. Dans 
une autre realisation, le module de TFR 85 pourrait ne considerer que les NCI 
parametres cepstraux cxjnf_q. 

30 Le module 86 convertit Techelle de frequences de maniere reciproque 

de la conversion operee par le module 32 du codeur, afin de restituer 
Testimation LXJnf de Tenveloppe inferieure comprimee, soumise au module de 
decompression spectrale 87. En sortie du module 87. le decodeur dispose 
d'une enveloppe inferieure XJnf comportant les valeurs du module du spectre 
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dans les vallees situees entre les pics harmoniques. 

Cette enveloppe X_inf va moduler le spectre d'une trame de bruit dont 
la phase est traitee en fonction du vecteur de ponderatlon quantifie Emix extrait 
par ie module 49. Un generateur 88 delivre une trame de bruit normalise dont 
les segments de A ms sent ponderes dans un module 89 conformement aux 
composantes normal isees du vecteur Emix fourni par le module 49 pour la 
trame courante. Ce bruit e st un bruit blanc filtre passe-haut oour tenir compte 
du faible niveau qu'a en principe la composante non-voisee aux -basses 
frequences. A partir du bruit pondere en energie. le module 90 forme des 
trames de 2N = 512 echantillons en appliquant la fenetre d'analyse f^, 
I'insertion de 256 echantillons a zero et la permutation circulaire pour la 
compensation de phase conformement a ce qui a ete explique en reference a 
la figure 3. La transformee de Fourier de la trame resultante.est calculee par le 
module TFR 91. 

L'estimation spectrale X,^ de la composante non-harmonique est 
determinee par le module de synthese spectrale 92 qui effectue une 
ponderation frequence par frequence. Cette ponderation consiste S multiplier 
cheque valeur spectrale complexe foumie par le module de TFR 91 par la 
valeur de I'enveloppe inferieure XJnf obtenue pour la meme frequence par le 
20 module de decompression spectrale 87. 

Les estimations spectrales X^. X,^ des composantes harmonique 
(voisee dans le cas d'un signal de parole) et non-harmonique (ou non-voisee) 
sont combinees par un module de mixage 95 controle par un module 96 
d'analyse du degre d'harmonicite (ou de voisement) du signal. 

L'organisation de ces modules 95, 96 est illustree par la figure 10. Le 
module d'analyse 96 comporte une unite 97 d'estimation d'un degre de 
voisement W dependant de la frequence, a partir duquel sont calcules quatre 
gains dependant de la frequence, a savoir deux gains g,. g^^ controlant 
I'importance relative des composantes harmonique et non-harmonique dans le 
signal synthetise. et deux gains g^_^. g^^_^ utilises pour bruiter la phase de la 
composante harmonique. 

Le degre de voisement W(i) est une valeur a variation continue 
comprise entre 0 et 1 determinee pour cheque index de frequence i (0 ^ i < N) 
en fonction de I'enveloppe superieure X_sup(i) et de I'enveloppe inferieure 
X_inf(i) obtenues pour cette frequence i par les modules de decompression 53. 
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87. Le degre de voisement W(i) est estime par Tunite 97 pour chaque index de 
frequence i correspondant a une harmonique de la frequence fondamentale Fq, 



a savoir i = 



Fe 2 



pour k=1,2..... par une fonction croissante du 



rapport entre renveloppe superieure X_sup et I'enveloppe inferieure XJnf a 
5 cette frequence, par exemple selon la formule : 

w(i).min{i.i2j£Ml^-°^y^ m 

Le seuil Vth(FQ) correspond a la dynamique moyenne calculee sur un spectre 
synthetique purement voise a la frequence fondamentale. II est 
avantageusement choisi dependant de la frequence fondamentale Fg. 
10 Le degre de voisement W(i) pour une frequence autre que ies 

frequences harmoniques est obtenu simplement comme etant egal a celui 
estime pour I'harmonique la plus proche. 

Le gain g^(i), qui depend de la frequence, est obtenu en appliquant une 

fonction non-lineaire au degre de voisement W(i) (bloc 98). Cette fonction non- 
15 lineaire a par exemple la forme representee sur la figure 1 1 : 

g^(i) = 0 si 0 < W{i) < W1 

g Yj) = ^^'^"^^ si W1 < W(i) < W2 (14) 
^v^^ W2-W1 

g^(i) = 1 siW2^W(i)<1 
Ies seuils W1, W2 etant tels que 0<W1 <W2 < 1. Le gain g^^ peut etre 
20 calcule de maniere semblable au gain g^ (la somme des deux gains g^, g^^^ 
etant constante. par exemple egale a 1), ou deduit simplement de celui-ci par 
la relation g^^{\) = 1 - g^{\), comme schematise par le soustracteur 99 sur la 

figure 1 0. 

II est interessant de pouvoir bruiter la phase de la composante 
25 harmonique du signal a une frequence donnee si T analyse du degre de 
voisement montre que le signal est plutot de type non-harmonique a cette 

frequence. Pour cela. la phase (py de la composante harmonique mixee est le 
resultat rfune combinaison lineaire des phases cp^, cp^j^ des composantes 
harmonique et non-harmonique X^, X^^ synthetisees par Ies modules 54, 92. 



0 
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Les gains g^_^, g^^^^ respectivement appliques a ces phases sont calcules a 
partir du degre de voisement W et ponderes egalement en fonction de I'index 
de frequence I. etant donne que le bmitage de la phase n'est veritablement 
utile qu'au-dela d'une certaine frequence. 

Un premier gain g^.,_^ est calcule en appliquant une fonction non- 
lineaire au degre de voisement W(i), comme schematise par le bloc 100 sur la 



figure 12 : 



9vi_9(i) = G1 si 0 < W(i) s W3 
gvi_,p(i) = G1 + (1 - G1)MZ^ si W3 < W(i) < W4 



(15) 



W4-W3 
gvl_<p(') = 1 siW4^W(i)£l 

les seuils W3 et W4 etant tels que 0 < W3 < W4 < 1. et le gain minimal G1 
etant compris entre 0 et 1 . 

Un multiplieur 101 multiplie pour chaque frequence d'index i le gain 
9vi_(p par un autre gain g^2_cp dependant seulement de I'index de frequence i, 
pour former le gain g^_^(i). Le gain g,2_^(i) depend non-lineairement de I'index 
de frequence i, par exemple comme indique sur la figure 13 : 

9v2_(p(') = 1 si 0 ^ i ^ i1 

9v2_cp(0 = si i1< i < i2 (16) 

9v2_<p(') = G2 sii2<i<1 
les index i1 et i2 etant tels que 0 < i1 < 12 ^ N. et le gain minimal G2 etant 
compris entre 0 et 1. Le gain g,^_^(i) peut etre calcule simplement comme 

etant egal a 1 -9^_^{\) = ^ - Q^^_^i\).g^,2_cp{i) (soustracteur 102 de la figure 
10). 

Le spectre complexe Y du signal synthetise est produit par le module 
de mixage 95. qui realise la relation de mixage suivante, pour 0 ^ 1 < N : 

Y(i) = gv(i).|Xv(i)|. exp\iip'^(\)] + g^^(j). x^^(i) (17) 
avec (p^ (i) = g^_^(j) ,p^(i) + g^^^^^jj ^^^(jj 

ou (p^(i) designe I'argument du nombre complexe \(\) fourni par le module 54 
pour la frequence d'index i (bloc 104 de la figure 10). et (p,,(i) designe 
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rargument du nombre complexe X^^(i) fourni par le module 92 (bloc 105 de la 

figure 10). Cette combinaison est realisee par las multiplieurs 106-110 et les 
additionneurs 111-112 representes sur la figure 1 0. 

Le spectre mixe Y(i) pour 0 < i < 2N (avec Y(2N-1-i) =Y(i)) est ensuite 
5 transforme dans le domaine temporel par le module de TFRI 115 (figure 8). On 
ne retient que les N/2 = 128 premiers et les N/2 = 128 derniers echantillons de 
— ^ — I q tramo do 2M ~ 512 oohanti ll ono produito par lo modu l o 116, ot on app l ique Iq 
permutation circulaire inverse de celle illustree par la figure 3 pour obtenir la 
trame synthetisee de N = 256 echantillons ponderes par la fenetre rf analyse f^. 

10 Les trames successivement obtenues de cette maniere sont finalement 

traitees par le module de synthese temporelle 116 qui forme le signal audio 
decode x. 

Le module de synthese temporelle 116 effectue une somme a 
recouvrement de trames modifiees par rapport a celles successivement 
15 evaluees en sortie du module 115. La modification peut etre vue en deux 
etapes illustrees respectivement par les figures 14 et 15. 

La premiere etape (figure 14) consiste a multiplier chaque trame 2' 
delivree par le module de TFRI 115 par une fenetre 1/f^ inverse de la fenetre 

d'analyse f^ employee par le module 1 du codeur. Les echantillons de la trame 

20 2" qui en resultent sont done ponderes uniformement. 

La seconde etape (figure 15) consiste a multiplier les echantillons de 
cette trame 2" par une fenetre de synthese fg verifiant les proprietes suivantes : 

fs(N-L+i) + fs(i) = A pourO<i<L (19) 

fs(i) = A pourL<i<N-L (20) 

25 ou A designe une constante positive arbitraire, par exemple A = 1. La fenetre 
de synthese f3(i) croit progressivement de 0 a A pour i allant de 0 a L. C'est par 

exemple une demi-sinusoide surelevee : 

fs(i) = ^.(l-cos[(i + 1/2)7c/L]) pourO < i < L (21) 

Apres avoir repondere chaque trame 2" par la fenetre de synthese fg, 

30 le module 116 positionne les trames successives avec leurs decalages 
temporels de M = 160 echantillons et leurs recouvrements temporels de L = 96 
echantillons, puis il effectue la somme des trames ainsi positionnees dans le 
temps. Du fait des proprietes (19) et (20) de la fenetre de synthese fg. chaque 
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echantillon du signal audio decode x ainsi obtenu est affecte d'un poids global 
uniforme, egal a A. Ce poids global provient de la contribution d'une trame 
unique si I'echantillon a dans cette trame un rang i tel que L < i < N - L. et 
comporte les contributions sommees de deux trames successives si 0 < i < L 
ou N - L ^ i < N. 

On peut ainsi effectu er la synthese temporelle de fagon simple meme 

L^uiiiiiiu uijr ii, ly LcJb cmibiuay. iy moouunjinmii l mm iiuux tiama^ 

successives est plus petit que la moitie de la taille N de ces trames. 

Les deux etapes exposees cl-dessus pour la modification des trames 
de signal peuvent etre fusionnees en une seule etape. II suffit de precalculer 
une fenetre composee f^d) = fs(i)/fA(i). et de multiplier simplement les trames 
2' de N = 256 echantlllons delivrees par le module 1 15 par la fenetre composee 
fc avant d' effectuer la sommation a recouvrement. 

La figure 16 montre I'allure de la fenetre composee f^ dans le cas ou la 
fenetre d'analyse f^ est une fenetre de Hamming et la fenetre de synthese fg a 
la forme donnee par les relations (19) a (21). 

□'autre formes de la fenetre de synthese fg verifiant les relations (19) 
et (20) peuvent etre employees. Dans la variante de la figure 17. c'est une 
fonction affine par morceaux definie par : 

fs(') = A.i/L pour0^i<L (22) 
Afin d'ameliorer la quaiite de codage du signal audio, le codeur de la 
figure 1 peut augmenter la cadence de formation et d'analyse des trames. afin 
de transmettre davantage de parametres de quantification au decodeur. Dans 
la structure de trame representee sur la figure 2, une trame de N = 256 
echantillons (32 ms) est formee toutes les 20 ms. Ces trames de 256 
echantillons pourraient etre formees a une cadence superieure. par exemple 
de 10 ms. deux trames successives ayant alors un decalage de M/2 = 80 
echantillons et un recouvrement de 176 echantillons. 

Dans ces conditions, on peut transmettre les jeux complets de 
parametres de quantification iF. icxs. icxi. iEm pour seulement un sous- 
ensemble des trames. et transmettre pour les autres trames des parametres 
permettant d'effectuer une interpolation adequate au niveau du decodeur. Dans 
I'exemple envisage ci-dessus, le sous-ensemble pour lequel des jeux de 
parametres complets sont transmis peut etre constitue par les trames de rang 
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entier n. dont la periodicite est de M/F^ = 20 ms, et les trames pour lesquelles 
une interpolation est effectuee peuvent etre celles de rang demi-entier n + 1/2 
qui sont decalees de 10 ms par rapport aux trames du sous-ensemble. 

Dans la realisation illustree par la figure 18, les notations cx_q [n-1] et 
5 cx_q[n] designent des vecteurs cepstraux quantifies determines, pour deux 
trames successives de rang entier, par le module de quantification 18 et/ou par 
le module de Quantification 34. Ces vecteurs comprennent par exemple quatre 
coefficients cepstraux consecutifs chacun. lis pourraient egalement 
comprendre davantage de coefficients cepstraux. 

10 Un module 120 effectue une interpolation de ces deux vecteurs 

cepstraux cx_q[n-1] et cx_q[n], afin rfestimer une valeur intermediaire 
cxJ[n~1/2]. L' interpolation effectuee par le module 120 peut etre une simple 
moyenne arithmetique des vecteurs cx_q[n-1] et cx_q[n]. En variante, le 
module 120 pourrait appliquer une formule d' interpolation plus sophistiquee, 

15 par exemple polynomiale, en se fondant egalement sur les vecteurs cepstraux 
obtenus pour des trames anterieures a la trame n-1, D' autre part, si plus d'une 
trame interpolee est intercalee entre deux trames consecutives de rang entier, 
interpolation tient compte de la position relative de chaque trame interpolee. 

A Taide des moyens precedemment decrits, le codeur calcule 

20 egalement les coefficients cepstraux cx[n-1/2] relatifs ^ la trame de rang demi- 
entier. Dans le cas de Tenveloppe superieure, ces coefficients cepstraux sont 
ceux fournis par le module de TFR1 13 apres post-liftrage 1 5 (par exemple avec 
les memes coefficients de post-liftrage que pour la trame precedente n-1) et 
normalisation 16. Dans le cas de Tenveloppe inferieure, les coefficients 

25 cepstraux cx[n-1/2] sont ceux delivres par le module de TFRI 33. 

Un soustracteur 121 forme la difference ecx[n-1/2] entre les 
coefficients cepstraux cx[n-1/2] calcules pour la trame de rang demi-entier et 
les coefficients cx_i[n-1/2] estimes par interpolation. Cette difference est 
fournie a un module de quantification 122 qui adresse des index de 

30 quantification icx[n-1/2] au multiplexeur de sortie 6 du codeur. Le module 122 
fonctionne par exemple par quantification vectorielle des erreurs d' interpolation 
ecx[n-1/2] successivement determinees pour les trames de rang demi-enfier. 

Cette quantificafion de Terreur tf interpolation peut etre effectuee par le 
codeur pour chacun des NCS + NCI coefficients cepstraux utilises par le 

35 decodeur. ou seulement pour certains d' entre eux, typiquement ceux d'ordres 
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les plus petits. 

Les moyens correspondants du decodeur sont illustres par la figure 19. 
Le decodeur fonctionne essentiellement comma celui decrit en reference a la 
figure 8 pour determiner les trames de signal de rang entier. Un . module 
d' interpolation 124 identique au module 120 du codeur estime les coefficients 
intermediaires cx_i[n-1/2] a partir des coefficients quantifies cx_q[n-1] et 
cx_q[n] fournis par le module 47 et/ou le module 48 a partir des index icxs, icxi 
extraits du flux Un module d' extraction de parametres 125 repoit I'index de 
quantification icx[n-1/2] depuis le demultiplexeur d'entree 45 du decodeur, et 
en deduit I'erreur d' interpolation quantifiee ecx_q[n-1/2] a partir du m§me 
dictionnaire de quantification que celui utilise par le module 122 du codeur. Un 
additionneur 126 fait la somme des vecteurs cepstraux cxjinr-l/2] et 
ecx_q[n-1/2] afin de fournir les coefficients "cepstraux cx[n-1/2] qui seront 
utilises par le decodeur (modules 51-57, 95. 96. 115 et/ou modules 85-87. 92. 
95, 96. 1 15) pour former la trame interpolee de rang n-1/2. 

Si certains seulement des coefficients cepstraux ont fait I'objet d'une 
quantification d'erreur d' interpolation, les autres sont determines par le 
decodeur par une interpolation simple, sans correction. 

Le decodeur peut egalement interpoler les autres parametres Fq, Emix 
utilises pour synthetiser les trames de signal. La frequence fondamentale Fq 
peut etre interpolee lineairement, soit dans le domaine temporel, soit (de 
preference) directement dans le domaine frequentiel. Pour I' interpolation 
eventuelle du vecteur de ponderation energetique Emix, il convient d'effectuer 
r interpolation apres denormalisation et en tenant compte bien entendu des 
decalages temporels entre trames. 

II est a noter qu'il est particulierement avantageux, pour interpoler la 
representation des enveloppes spectrales, d'effectuer cette interpolation dans 
le domaine cepstral. Contrairement a une interpolation effectuee sur d'autres 
parametres. tels que les coefficients LSP (« Line Spectrum Pairs »), 
r interpolation lineaire des coefficients cepstraux correspond a I' interpolation 
lineaire des amplitudes spectrales comprimees. 

Dans la variants representee sur la figure 20, le codeur utilise les 
vecteurs cepstraux cx_q[n], cx_qln-1]. .... cx_q[n-r] et cx_q(n-1/2] calcules 
pour les dernieres trames passees (r > 1) pour identifier un filtre interpolateur 
optimal qui, lorsqu'on lui soumet les vecteurs cepstraux quantifies cx_q[n-r], 
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cx_q[n] relatifs aux trames de rang entier, delivre un vecteur cepstral 
interpole cxJ{n-1/2] qui presente une distance minimale avec le vecteur 
cx[n-1/2] calcule pour la derniere trame de rang demi-entier. 

Dans Texemple represents sur la figure 20. ce filtre interpolateur 128 
5 est present dans le codeur. et un soustracteur 129 retranche sa sortie 
cxJ[n-1/2] du vecteur cepstral calcule cx[n-1/2]. Un module de minimisation 
130 determine le jeu de parametres {P} du filtre interpolateur 128, pour lequel 
I'erreur d interpolation ecx[n-1/2] delivree par le soustracteur izy presente une 
norma minimale. Ce jeu de parametres {P} est adresse a un module de 
10 quantification 131 qui fournit un index de quantification correspondent iP au 
multiplexeur de sortie 6 du codeur. 

En fonction du debit alloue dans le flux <D aux index de quantification 
des parametres {P} definissant le filtre interpolateur optimal 128, on pourra 
adopter une quantification plus ou moins fine de ces parametres, ou une forme 
15 plus ou moins elaboree du filtre interpolateur, ou encore prevoir plusieurs filtres 
interpolateurs quantifies de maniere distincte pour differents vecteurs de 
coefficients cepstraux. 

Dans une realisation simple, le filtre interpolateur 128 est lineaire. avec 

r = 1 : 

20 cxJ[n-1/2] = p.cx_q[n-1] + (1-p).cx_q[n] (23) 

et le jeu de parametres {P} se limite au coefficient p compris entre 0 et 1 . 

A partir des index iP de quantification des parametres {P} obtenus dans 
le flux binaire (p, le decodeur reconstruit le filtre interpolateur 128 (aux erreurs 
de quantification pres), et traite les vecteurs spectraux cx_q[n-r], .... cx__q[n] 

25 afin d'estimer les coefficients cepstraux cx[n-1/2] utilises pour synthetiser les 
trames de rang demi-entier 

De fagon generate, le decodeur peut utiliser une methode 
d' interpolation simple (sans transmission de parametres de la part du codeur 
pour les trames de rang demi-entier). une methode d' interpolation avec prise 

30 en compte d'une erreur d' interpolation quantifiee (selon les figures 17 et 18), ou 
une methode d' interpolation avec un filtre interpolateur optimal (selon la figure 
19) pour evaluer les trames de rang demi-entier en plus des trames de rang 
entier evaluees directement comme explique en reference aux figures 8 a 13. 
Le module 116 de synthese temporelle peut alors combiner I'ensemble de ces 

35 trames evaluees pour former le signal synthetise x de la maniere expliquee ci- 
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apres en reference aux figures 14, 21 et22. 

Comme dans la methode de synthese temporelle precedemment 
decrite. le module 116 effectue une somme a recouvrement de trames 
modifiees par rapport a celles successivement evaluees en sortie du module 
115. et cette modification peut etre vue en deux etapes dont la premiere est 
identique a celle precedemment decrite en reference a la figure 14 (diviser les 

Mom dc Iq tromc 2.' DQF Id frnr t rr ff ' ^ 

La seconde etape (figure 21) consiste a multiplier les echantillons de la 
trame renormalisee 2" par une fenetre de synthese fg veriflant les proprietes 
suivantes : 

fs (i) = 0 pour 0 < i < N/2 - M/p et N/2 + M/p < i <N (24) 

(0 + fs (i + M/p) = A pour N/2 - M/p < i < N/2 (25) 
ou A designe une constante positive arbitraire, par exemple A = 1, et p est 
rentier tel que le decalage temporel entre les trames successives (calculees 
directement et interpolees) soit de M/p echantillons. soit p = 2 dans I'exemple 
decrit. La fenetre de synthese fs(i) croTt progressivement pour I allant de 
N/2 - M/p a N/2. C'est par exemple une sinusoide surelevee sur Cintervalle 
N/2 - M/p < i < N/2 + M/p. En particulier. la fenetre de synthese fs peut etre. 
sur cet intervalle, une fenetre de Hamming (comme represente sur la figure 21) 
ou une fenetre de Manning. 

La figure 21 montre les trames successives 2" repositionnees dans le 
temps par le module 116. Les hachures indiquent les portions 6liminees des 
trames (fenetre de synthese a 0). On voit qu'en effectuant la somme a 
recouvrement des echantillons des trames successives. la propriete (25) 
assure une ponderation homogene des echantillons du signal synthetise. 

Comme dans la methode de synthese illustree par les figures 14 et 15. 
la procedure de ponderation des trames obtenues par transformee de Fourier 
inverse des spectres Y peut etre effectuee en une seule etape. avec une 
fenetre composee fdi) = fs(i)/fA(i). La figure 22 montre la fomie de la fenetre 
composee fc dans le cas ou les fenetres f^ et fg sont de type Hamming. 

Comme la methode de synthese temporelle illustree par les figures 14 
a 17. celle illustree par les figures 14. 21 et 22 permet de prendre en compte 
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un recouvrement L entre deux trames d'analyse (pour lesquelles I'analyse est 
effectuee de fagon complete) plus petit que la moitie que la taille N de ces 
trames. De fagon generale. cette derniere methode est applicable lorsque les 
trames d'analyse successives presentent des decalages temporels mutuels M 
5 de plus de N/2 echantillons (meme eventuellement de plus de N echantillons si 
un tres bas debit est requis), rinterpolation conduisant a un ensemble de 
trames dont les decalages temporels mutuels sont de moins de N/2 
echantillons. 

Les trames interpolees peuvent faire I'objet d'une transmission reduite 

10 de parametres de codage, comme decrit precedemment. mais cela n'est pas 
obligatoire. Ce mode de realisation permet de conserver un intervalle M 
relativement grand entre deux trames d'analyse, et done de limiter le debit de 
transmission requis, tout en limitant les discontinuites susceptibles d'apparaitre 
en raison de la taille de cet intervalle par rapport aux echelles de temps 

15 ty piques des variations des parametres du signal audio, notamment les 
coefficients cepstraux et la frequence fondamentale. 

Les figures 23 a 25 montrent d'autres formes de realisation des 
moyens employes pour traiter les coefficients cepstraux cx_sup delivres par le 
module de TFRI 13 de la figure 1, representant I'enveioppe superieure. 

20 Dans les trois cas, les modules de post-liftrage 15, de normalisation 16, 

de quantification 18 et de calcul des amplitudes spectrales 28 sont 
essentiellement identiques a ceux precedemment decrits en reference a la 
figure 1. En outre, des modules de post-liftrage 140, de lissage 141 et 
d'extraction de phase minimale 142 sont prevus pour traiter les coefficients 

25 cepstraux post-liftres et quantifies cx_sup_q delivres par le module de 
quantification 18. Ces modules 140-142 fonctionnement essentiellement 
comme les modules correspondants 55-57 du decodeur de la figure 8. 

Dans la forme de realisation montree sur la figure 23, le module 
d'adaptation 144 accomplit une fonction semblable a celle du module 29 de la 

30 figure 1. Mais I'adaptation n'est pas realisee sur la seule base du module du 
spectre, Le module 144 determine le meilleur jeu de coefficients pour le post- 
liftre 15 en minimisant Tecart entre le spectre du signal audio, en module |X| et 
en phase cp^, et des valeurs complexes recalculees pour une ou plusieurs des 

harmoniques de la frequence fondamentale. Les modules de ces dernieres 
35 valeurs complexes sont donnees par le module de calcul 28, et leurs phases 
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correspondent aux phases minimales (p(k) fournies par le module d' extraction 
142. Pour realiser {'adaptation, le module 144 peut prendre en compte toute 
distance appropriee dans le plan complexe. par exemple la distance 
euclidienne. 

Ainsi. {'adaptation du post-liftre 15 par le module 144 tient compte de 
fagon combinee d'aspects frequentiels du signal, refletes par le module du 

spectre, et des aspects te mporels. refletes par la phase du spectre. 

Comme represents en pointilles sur la figure 23. le post-liftre 140 peut 
egalement etre adaptatif. I'adaptation effectuee par le module 144 portant 
conjointement sur les deux post-iiftres 15, 140. Dans ce cas, le post-liftre 55 du 
decodeur (figure 8) est adapte. comme le post-liftre 140. en fonction de 
parametres iLif que le module d'adaptation 144 fournit au multiplexeur 6 pour 
qu'il les indue dans le flux numerique <D. Typiquement. quelques jeux de 
coefficients y^, sont prevus pour les post-liftres 140 et 55, et le module 144 
precede a un test exhaustif de ces differents jeux de coefficients pour retenir 
celui qui minimise I'ecart dans le plan complexe. 

Dans I'exemple represente sur la figure 24. le module d'adaptation 29 
du post-liftre 15 est identique a celui de la figure 1. La figure 24 montre un 
module 145 d-estimation d'une courbe de masquage permettant au module 29 
de selectionner, pour la minimisation de I'ecart en module, la ou les frequences 
harmoniques qui depassent le plus de la courbe de masquage calculee sur la 
base du spectre en module |X| . comme decrit precedemment. 

Le post-liftre 140 de la figure 24 est adapte separement par un module 
146 qui realise la minimisation des ecarts entre la phase (p^ du spectre du 
signal et la phase minimale (p(k) calculee par le module 142 pour une ou 
plusieurs des harmoniques. La aussi. les harmoniques selectionn§es pour le 
calcul de I'ecart de phase minimise peuvent I'etre en fonction de la courbe de 
masquage estimee par le module 145. Le module 146 fournit au multiplexeur 
de sortie 6 du codeur les parametres iLif qui representent le post-liftre optimall 
140. pour qu'ils soient utilises dans le post-filtre 55 du decodeur. 

Dans I'exemple illustre par la figure 25. le post-liftre 140 servant dans 
le calcul des phases minimales n'est pas adaptatif. Les phases minimales (p(k) 
calculees par le module 142 pour les harmoniques de la frequence 
fondamentale sont comparees aux phases du spectre du signal audio, et 
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Tecart de phase fait Tobjet d'une quantification par un module 148. Les index 
de quantification correspondants iAcp sont fournis par le module 148 au 
multiplexeur de sortie 6 du codeur. 

Dans un decodeur (figure 26) correspondant a un codeur selon la 
5 figure 25. un module 149 exploite ces index de quantification lAcp fournis par le 
demultiplexeur 45 pour obtenir les valeurs des ecarts de phase quantifies, 
qu'un additionneur 150 ajoute aux phases minimales (p{k) calculees par le 
module 57 (les post-liftres 140 et 55 etant identiques). Les phases fourhies par 
I'additionneur 150 sont ensuite utilisees par le module 54 qui synthetise les 
10 raies spectrales de la composante harmonique X^. 

L'ecart de phase quantifie par le module 148, et que les modules 149 
et 150 du decodeur utilisent pour corriger les phases minimales (p(k), peut etre 
de deux natures : 

- il .peut representer, pour chaque frequence tf index i correspondant a une 
15 harmonique d'ordre k de la frequence fondamentale Fq la difference entre 

la phase cpx(i) du spectre du signal a la frequence i et la phase minimale 

(p(k) calculee par le module 142 pour I'harmonique k ; 

- alternativement ou cumulativement, cet ecart de phase peut representer 
la variation de la phase cp^ du spectre sur la largeur d'un ou plusieurs 

20 pics spectraux correspondant a des harmoniques du signal, cette 

variation etant relative a la phase minimale (p(k) affectee aux pics en 
question. 

Dans les deux cas, le ou les pics pour lesquels l'ecart de phase est 
quantifie peuvent etre choisis en fonction de Tenergie spectrale representee 
25 par Tenveloppe superieure, qui est disponible au codeur et au decodeur, ce qui 
permet au decodeur de determiner a quelle raie spectrale les ecarts doivent 
etre appliques. 

Dans le premier cas, les ecarts de phase peuvent faire I'objet d'une 
quantification scalaire, ou vectorielle si on les regroupe pour plusieurs pics. 
30 Dans le second cas. la variation de la phase cpx autour de la phase 

minimale (p(k) sur la largeur d'un pic harmonique (determinee par la largeur de 
la raie de reference utilisee par le module 54), peut etre representee 
simplement par la pente d'un segment lineaire selectionne comme etant celui 
qui presente une distance quadratique minimale avec la courbe de variation de 
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phase du spectre sur la largeur de la raie, et eventuellement par un decalage a 
I'origine. 

Ces pentes peuvent faire I'objet d'une quantification scalaire, ou 
vectorielle si on les regroupe pour plusieurs pics. 

La quantification des variations de phase sur les pics harmoniques 
peut porter sur I' ensemble des frequences harmoniques. Une autre possibilite 
est de quantifier plusieurs pentes obtenues cliacune par moyen nage des 
pentes aux harmoniques sur une ou plusieurs sous-bandes du spectre. Ce 
moyennage peut etre pondere pour prendre en compte les energies relatives 
aux differentes frequences harmoniques. representees par I'enveloppe 
superieure. 

Le module 148 peut egalement modeliser la variation de phase sur la 
largeur d'un pic par une courbe plus complexe qu'un segment lineaire, par 
exemple un spline, dont les parametres sont quantifies pour etre transmis au 
decodeur. 

Une autre possibilite est d'effectuer un apprentissage prealable de 
modeles de phase aux harmoniques, representatifs des variations de la phase 
sur la largeur des pics, observees sur un corpus de signaux de reference. Ces 
modeles sont ranges dans un dictionnaire memorise par les modules 148 et 
149. Le module 148 du codeur determine les index iAcp correspondant aux 
adresses des modeles les plus proches des variations de phase au voisinage 
des pics harmoniques consideres, et le module 149 du decodeur recupere ces 
modeles pour la synthese de la phase de la composante harmonique. 
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REVENDICATIONS 

1. Precede de codage tfun signal audio, dans lequel on estime une 
frequence fondamentale (Fq) du signal audio, on determine un spectre du 
signal audio par une transformee dans le domaine frequentiel d'une trame du 

5 signal audio, et on inclut dans un flux numerique de sortie (O) des donnees de 

codage dune composante hai^rttflhiqus flU Signal auUlu. uuiiipiyfiaiil Uyy 

donnees representatives d'amplitudes spectrales associees a des frequences 
multiples de la frequence fondamentale estimee, caracterise en ce que lesdites 
donnees representatives d' amplitudes spectrales associees a des frequences 
10 multiples de la frequence fondamentale (Fq) sont obtenues au moyen de 
coefficients cepstraux calcules en transformant dans le domaine cepstral une 
enveloppe superieure comprimee (LX_sup) du spectre du signal audio, et en 
ce que les donnees de codage de la composante harmonique comprennent en 
outre, pour au moins une des frequences multiples de la frequence 
15 fondamentale estimee, des donnees (iAcp ; iLif) relatives a la phase du spectre 
du signal audio au voisinage de ladite frequence multiple. 

2. Precede selon la revendication 1. dans lequel I' enveloppe 
superieure comprimee (LX_sup) est determinee par interpolation desdites 
amplitudes spectrales associees aux frequences multiples de la frequence 
fondamentale (Fq) avec application d'une fonction de compression spectrale. 

3. Precede selon la revendication 1 ou 2. dans lequel on transforme les 
coefficients cepstraux par liftrage et lissage dans le domaine cepstral. et on 
calcule des phases minimales (cp(k)) du signal audio a des frequences multiples 
de la frequence fondamentale (Fq) sur la base des coefficients cepstraux 

transformes (cxl[n]), 

4. Precede selon la revendication 3, dans lequel on quantifie un ecart 
de phase entre le spectre du signal audio a au moins une frequence multiple 
de la frequence fondamentale (Fq) et la phase minimale calculee 

correspondante ((p(k)), et on inclut des parametres de quantification (iAcp) dudit 
30 ecart de phase dans les donnees de codage de la composante harmonique. 
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5. Precede selon la revendication 3, dans lequel on adapts ledit liftrage 
de fagon a minimiser un ecart de phase entre le spectre du signal audio a au 
moins une frequence multiple de la frequence fondamentale (Fq) et la phase 
minimale calculee correspondante ((p(k)), et on inclut des parametres (iLif) 
representatifs du liftrage adapts dans les donnees de codage de la 
composante harmonique. 

6. Procede selon la revendication 5, dans lequel Tecart de phase 
minimise pour Tadaptation du liftrage se rapporte a au molns une frequence 
multiple de la frequence fondamentale (Fq). selectionnee sur la base de 
rimportance du module du spectre en valeur absolue. 

7. Procede selon la revendication 5. dans lequel on estlme une courbe 
de masquage spectral du signal audio au moyen d'un modele psycho- 
acoustique. et I'ecart de phase minimise pour I'adaptation du liftrage se 
rapporte a au moins une frequence multiple de la frequence fondamentale (Fg). 

selectionnee sur la base de I'importance du module du spectre relatlvement a 
la courbe de masquage. 

8. Procede selon I'une quelconque des revendications 3 a 7. dans 
lequel on examine les variations des coefficients cepstraux (cxp[n]) pour 
appliquer un lissage moins important en presence de variations brusques qu'en 
presence de variations lentes. 

9. Procede selon la revendication 8, dans lequel on effectue le lissage 
des coefficients cepstraux au moyen d'un facteur d'oubli (X^) choisi en fonction 
d'une comparaison entre un seuil {d^^^) et une distance (d) entre deux jeux 
successifs de coefficients cepstraux (cxp[n-1], cxp[n]). 

10. Procede selon la revendication 9, dans lequel ledit seuil {d^^^) est 
adapte en fonction des variations des coefficients cepstraux (cxp[n]). 

11. Procede selon I'une quelconque des revendications 3 a 10. dans 
lequel le liftrage est de la forme Cp(i) = [1 +y2'-Yiac(i) - ou Cp(i) et c(i) 
designent le coefficient cepstral d'ordre i respectivement avant et apres liftrage. 
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et 72 sont des coefficients compris entre 0 et 1 et ^ est un coefficient de 
preaccentuation. 

12. Precede selon la revendication 1 1 . dans lequel |a = (72 - Yi) c(1). 

13. Precede selon Tune quelconque des revendications 1 a 12. dans 
5 lequel on quantifie une variation de la phase du spectre du signal audio sur au 

moms un intervalle de frequences firtmant uns TrSquerJTO rnulllpltJ UtJ la 

frequence fondamentale (Fq). et on inclut des parametres (iA(p) de 
quantification de ladite variation de phase dans les donnees de codage de la 
composante harmonique. 

10 14. Precede selon la revendication 13, dans lequel la variation de phase 

quantifiee est representee par la pente de la phase du spectre a la frequence 
multiple de la frequence fondamentale (Fq). 

15. Precede selon la revendication 13. dans lequel la variation de phase 
quantifiee represente un modele de phase memorise dans un dictionnaire 

15 determine par apprentissage. 

16. Codeur audio, comprenant des moyens pour executer un precede 
selon Tune quelconque des revendications 1 a 15. 

17. Precede de decedage d'un flux numerique d'entree (O) representant 
un signal audio cede, dans lequel on regoit dans le flux numerique d'entree des 
donnees de codage d'une frequence fondamentale (Fq) du signal audio et des 

donnees de codage d'une composante harmonique comprenant des donnees 
de quantification de coefficients cepstraux representant une enveloppe 
spectrale superieure (X_sup) du signal audio, et on genere une estimation 
spectrale (X^) de la composante harmonique dent le module est determine par 
ladite enveloppe spectrale superieure aux frequences multiples de la frequence 
fondamentale, caracterise en ce que, pour determiner la phase ((p^) de 
r estimation spectrale de la composante harmonique (X^), on transforme les 
coefficients cepstraux par liftrage et lissage dans le domaine cepstral. et on 
calcule des phases minimales ((p(k)) du signal audio a des frequences multiples 
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de la frequence fondamentale sur la base des coefficients cepstraux 
transformes (cxl[n]). 

18. Procede salon la revendication 17. dans lequel, pour obtenir la 

phase ((p^) de I'estimation spectrale (X^) de la composante harmonlque. on 
modifie au moins une phase minimale calcul6e ((p(k)) sur la base de donnees 
de quantification d'ecart de phase (lAcp) comprises dans les d onnees de 
codage de la composante harmonique. ~~~~~~~~ — 

18. Procede selon la revendication 18, dans lequel les donnees de 
quantification d'ecart de phase (iA(p) sont utilisees pour determiner une 
variation de la phase ((p^) de I'estimation spectrale (X^) de la composante 
harmonique sur au moins un intervalle de frequences entourant une frequence 
multiple de la frequence fondamentale (Fq). 

20. Procede selon la revendication 19, dans lequel la variation de phase 

determinee sur un intervalle de frequences est une variation lineaire 
representee par un parametre de quantification de pente. 

21 Procede selon la revendication 1 9, dans lequel la variation de phase 

determinee sur un intervalle de frequences represente un modele de phase 
memorise dans un dictionnaire determine par apprentissage. 

22. Procede selon I'une quelconque des revendications 17 a 21, dans 
lequel on adapte ledit liftrage en fonction de parametres (iLif) compris dans les 
donnees de codage de la composante harmonique. 

23. Procede selon I'une quelconque des revendications 17 a 22, dans 
lequel on examine les variations des coefficients cepstraux (cxp(n]) pour 
appliquer un lissage moins important en presence de variations brusques qu'en 
presence de variations lentes. 

24. Procede selon la revendication 23, dans lequel on effectue le lissage 
des coefficients cepstraux (cxp[n]) au moyen d'un facteur d'oubli (X^) choisi en 
fonction d-une comparaison entre un seuil (d,^) et une distance (d) entre deux 
jeux successifs de coefficients cepstraux (cxp[n-1], cxp[n]). 
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25. Procede selon la revendication 24. dans lequel ledit seuil (d^^^) est 
adapte en fonction des variations des coefficients cepstraux (cxp[n]). 

26. Procede de decodage d'un flux numerique tf entree (O) representant 
un signal audio code, dans lequel on regoW dans le flux numerique d'entree des 

5 donnees de codage d'une frequence fondamentale (Fg) du signal audio et des 
donnees de codage d'une composante harmonique comprenant des donnees 
de quantification de coefficients cepstraux representant une enveloppe 
spectrale superieure (X_sup) du signal audio, et on genere une estimation 
spectrale (X^) de la composante harmonique dont le module est determine par 
ladite enveloppe spectrale superieure aux frequences multiples de la frequence 
fondamentale, caracterise en ce qu'on determine une variation de"la phase (cp^) 

de I'estimation spectrale de la composante harmonique sur au moins un 
intervalle de frequences entourant une frequence multiple de la frequence 
fondamentale sur la base de parametres de quantification (lAcp) inclus dans les 
donnees de codage de la composante harmonique. 

27. Procede selon la revendication 26, dans lequel la variation de phase 
determinee sur un intervalle de frequences est une variation lineaire 
representee par un parametre de quantification de pente. 

28. Procede selon la revendication 26, dans lequel la variation de phase 
20 determinee sur un intervalle de frequences represents un modele de phase 

memorise dans un dictionnaire determine par apprentissage. 




29. Decodeur audio, comprenant des moyens pour executer un procede 

selon Tune quelconque des revendications 17 a 28. 



1/13 



X 


FORMATION 






TRAMES 








\ 


DEJECTION 
FREQUENCE 
FONDAMENTALE 



TFR 



9x 



COMPRESSION 
SPECTRALE 



'8 



FIG.1 




LXJnf 



LIN^AIRE— MEL 



13ri 



LINEAIRE 



TFRI 



I 



->MEL | ._ 



33— ^f'R' 



CX_sup 



34 



|cx_inf 



QUANTiFiCATION 



P05T_LIFTRAGE 



"* NORMALISATION 



h6 



QUANTIFiCATiOfT^ ^^ 



CX.sup 



1 



CALCUL 

AMPLITUDES 
SPECTRAI FS 



ADAPTATION 
POST-LiFTRAGE 



2f 



36- 



39- 



CX_inf_q 



-32 



DECOMPRESSION 
SPECTRALE 



37- 



EM 



TFRI 



, CALCUL 
ENERGIES/ 
SEGMENT 



El 



NORMALISATION 



jEmix 



QUANTIFICATION 
T 



40 



lEm 



icxi 
icxs 
IF 





ALX(i) FIG.5. 




4/13 




FIG.6. 



rex [n] 



icx 



QUANTIFICATION 

VECTORIELLE 



'22 



24 



rcx_q [h] 



•pri rcx.,qCn-ij 




23 



cx«q[n] 




LX_inf 
i 



|X| ^ 



36H DECOMPRESSION 
SPECTRALE 



I 



42 



SELECTION 

PAR FRE0UENCE5I 



I 



TFRI 



T 



FIG. 7. 



'37 



5/13 



UIT 




.2.0 




BRI 







o to 

•p IIJ 

era 



UJ 

to o 
UJ > 

in 



CD 



UJ 




6/13 



60— d-.-D(cxp[rt)^cxprnji| 



61 



65 



'62 



^mifr~^min2 



± 



± 



-66 



67- 



^s,NON 



± 



dmin*~^min • dinin+{l-^min)-d 



76 



72- 



dth^P • dmox + ( 1- P ) • d min 

71 



68 



oui 



NON 



~r~ 



~~r~ 



cxl[n]— Xc-cxL[n-l] + (1-Ac)'Cxp[nl 



FIG.9. 



75- 



76- 



-73 
-74 



77- 



9(k)*-0 
I 



1 



H>(k)— 9(k)-2.cxL[n,m].sin(2T[mk|9_) 

HZ 



76' 



ouix 



8CK^ 
81 



m-^m+l 

mrNCSr^ 



NON 



k^k+1 



79 



7/13 



|X-SUp 



X-inf 



FIG .10. 





G2 ( 



W2 { 

FIG.11 



W(|) 



W3 W4i 

FIG.12. 




I I 



1 



ii is 

FIG .13. 



N 



9/13 





cx.q [n_i] 

__L 



10/13 
:x[n-l] 



cx 



INTERPOLATION 



ec] 




Y^;22 FIG .18. 

• 1 




(lUANIIhlUAIlUN 





l|ficx[n-l] 



cx 



124 



icx 



cx_q [n] 



EXTRACTION 



INTERPaATION 



cx_i[n-2 



r 



'125 



ecx_q [n- 1] 
+V-126 



FIG .19. 




CX 



cx_q [n-r| . . . cx>q [n-l| cx_q [h] 

I I I 



128- 



fIltre interpolateur 



cx 



["-ii 



ISO- 




MINIMISATION 



131 



FIG.20 



QUANTIFiCATION 
fiP 



15^ 

16- 
18 



|cx_sup 



POST-LiFTRAGE 



FIG.23. 



NORMALISATION 



aUANTIFICATION 



140 



P05T-LIFTRAGE 



LISSAGE 



28- 



|x|- 



cx_sup^q 



CALCUL 
AMPLITUDES 
5PEgTRALg§ 



5iJ 



ADAPTATION 
POST-LiFTRAGE 
1 



cxlCn] Vll 



EXTRACTION 

.PHASE 
MINIMALE 



142 



MA 



i 



cx_ sup 



POST_LIFTRAGE 



I 



NORMALISATION 



^15 
pJ6 



I 



aUANTIFlCATDN 



M 

i 



'18 



cx_sup-q 



CALCUL 
AMPLITUDES 

SPECTRALES 



I 



28 



145- 



ADAPTATION 
POST-LiFTRAGE 

I 



M 



ESTIMATION 
MAS QUAGE 

i 



F1G.24 



1 



POST_LIFTRAGE 



cxp [n] 



LISSAGE 



cxl[n] 



J40 



141 



EXTRACTION 

.PHASE 
MINIMALE 



142 



29 



146^ 



1 



ADAPTATION 
POST-LiFTRAGE 



13/13 



T 



M 



^ |cx_sup 

POST_L(FTRAGE 



'15 



NORMALISATION 



1^6 



I 



>18 



cx,sup_q 



CALCUL 
AMPLITUDES 

SPECTRALES 



ADAPTATION 
POST-LiFTRAGE 

I 



'29 



^ Fo 



FIG.25. 



1 



POST_LIFTRAGE 



140 



cxp [n] 



141 



cxun 



142 



EXTRACTION 

.PHASE 
MINIMALE 



148— 



QUANTIFICATION 
ECART DE PHASE 




149- 



EXTRACTION 

fCART 
DE PHASE 



54' 



EXTRACTION 

PHASE 
MINIMALE 



-57 



i 




FIG.26. 



X_sup 



5YNTHESE 
RAIES SPECTRALES 



Xv 



This Page is Inserted by IFW Indexing and Scanning 
Operations and is not part of the Official Record 



Defective images within this document are accurate representations of the original 
documents submitted by the applicant. 

Defects in the images include but are not limited to the items checked: 

□ BLACK BORDERS 

□ IMAGE CUT OFF AT TOP, BOTTOM OR SIDES 

□ FADED TEXT OR DRAWING 

□ BLURRED OR ILLEGIBLE TEXT OR DRAWING 

□ SKEWED/SLANTED IMAGES 

□ COLOR OR BLACK AND WHITE PHOTOGRAPHS 

□ GRAY SCALE DOCUMENTS 



□ R£FERENCE(S) OR EXHIBIT(S) SUBMITTED ARE POOR QUALITY 

□ OTHER: ^ 

IMAGES ARE BEST AVAILABLE COPY. 
As rescanning these documents will not correct the image 
problems checked, please do not report these problems to 
the IFW Image Problem Mailbox. 



BEST AVAILABLE IMAGES 




LINES OR MARKS ON ORIGINAL DOCUMENT 



THfS PAGE BLANK (uspto) 



